En la mayorĆa de los paĆses, la principal figura polĆtica (ya sea un presidente, ministro, rey, etc.), maneja un discurso que va dirigido a la lucha contra la pobreza, la desigualdad económica y la prosperidad en su paĆs, sin embargo, ĀæCuĆ”nto gana el principal representante de cada paĆs? ĀæEs menor el salario de un presidente en un paĆs pobre, comparado con un paĆs de primer mundo?
Para responder esto, buscamos datos relacionados a los ingresos de los presidentes o representantes del gobierno de cada paĆs en 2021, los cuales exploraremos con distintos grĆ”ficos. Cabe resaltar que varios paĆses presentan tanto un Presidente como un Primer ministro. Los datos se pueden encuentrar aqui, y para trabajarlos realizamos un script en Python usando web scrapping (ya que los datos no se pueden descargar directamente).
En algunos casos observamos que en lugar de āPresidenteā existe el dato de āPrimeros ministrosā. Para el caso de Syria, se reporta un sueldo, sin embargo, no se especĆfica en que categorĆa entra la principal figura polĆtica de este paĆs.
Para completar mĆ”s el anĆ”lisis de estos datos, se agregó una columna que indica el continente al cual corresponde el paĆs, para una mejor comparación.
En esta sección exploramos los datos correspondientes de Presidentes o Representante del paĆs para ver su comportamiento y cómo varĆan los sueldos reportados por aƱo. Para esto, aprovechamos el grĆ”fico de boxplot con la columna correspondiente a los continentes.
AquĆ observamos un problema, ya que con la escala normal podemos ver que los valores extremos no se logra observar la distribución de los demĆ”s puntos. Si no tenemos cuidado, en la escala parecerĆa que todos los demĆ”s puntos (Presidentes) ganan $0 lo cual serĆa una interpretación incorrecta.
Para estos casos, podemos aplicar una escala logarĆtmica (o exponencial) para distinguir mejor las diferencias entre sueldos.
La otra opción que tenemos para distinguir las diferencias entre los valores es generar intervalos o bins que nos permitan agrupar por el sueldo que mantienen (como lo veremos mÔs adelante).
Ahora, otro tipo de grĆ”fico que podemos utilizar para representar los datos es realizando mapas geogrĆ”ficos. Para ello, podemos utilizar la paqueterĆa maps que contiene las coordenadas de los paĆses para usarlos en ggplot2. AquĆ es conveniente utilizar la variable categórica por los intervalos realizados y los colores representarĆ”n estos intervalos, ya que como en el ejemplo del box plot los valores extremos afectan la escala continua de colores ocultando todos los demĆ”s valores, como podemos ver en la siguiente comparación:
Para completar nuestra exploración de datos realizamos el mismo grÔfico, pero interactivo.
Uno de los principales problemas de realizar grĆ”ficos de mapas es tener el nombre correcto de los paĆses por lo que debemos verificar si los nombres van de acuerdo con el dataset de R o de sus paqueterĆas. Una vez que los nombres de los paĆses coincidan se puede realizar el grĆ”fico con la paqueteria highcharter.
AquĆ se muestra el mapa interactivo utilizando las categorĆas que representan los intervalos:
En esta sección exploramos los datos de los primeros ministros (o Representantes del Gobierno). En los casos en el que no se presente un dato es muy probable que no tengan primer ministro y el presidente es quien cubra esta Ôrea.
Al igual que con los presidentes, usamos el grÔfico de boxplot. Utilizando la escala normal se ve una mejor distribución de los datos, comparado con lo observado en los presidentes:
No obstante, se puede mantener la escala exponencial ya que hay un punto que se puede considerar como un outlier o extremo:
Se puede observar que el primer ministro con mayor sueldo es de Singapore.
Al igual que en la sección anterior, a partir de una variable numérica creamos intervalos. Con los datos en un formato adecuado podemos ahora representar estos datos en un mapa:
Como observamos en la sección anterior, muchos paĆses no presentan un primer ministro, ya que el Presidente es quien funciona como representante de Estado y de Gobierno. Para poder tener un panorama mĆ”s general, comparando los sueldos de los principales representantes de cada paĆs (ya sean presidentes o primeros ministros), en la preparación de los datos se creó una columna con el valor de Presidente en caso de no tener un primer ministro.
Para representar esta nueva organización de datos, podemos hacer el grafico de boxplot con una escala exponencial:
Y ahora representarlos en un mapa como en las secciones anteriores:
Y tambiƩn mediante un mapa interactivo:
Por Ćŗltimo, con todo esta preparación de datos, generamos una infografĆa construida con ggplot2 para mostrar todos los detalles que se pueden agregar. Este grĆ”fico lo puedes ver aqui.